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Abstract of EP1 059580 

The processor carries out commands which 
belong to different command group^,, in',different , 
components of the processor. A sequence of 
commands belonging to a command sequence 
and to be carried out in different components, are 
carried out at the same time. The processor 
translates the commands read from the program 
and/or data memory into macrocommands and 
stores them. The commands translated into 
macrocommands are the commands which can 
be processed at the same time by the processor 
and are to be carried out by different components 
of the processor. Part of the commands are 
carried out in a structured hardware block of the 
processor, configured to carry out the operations 
for the commands. 
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(54) Programmgesteuerte Einheit 

(57) Die programmgesteuerte Einheit zeichnet sich 
dadurch aus, da3 Befehle, die unterschiedlichen Be- 
fehlsgruppen angehoren, in unterschiedlichen Kompo- 
nenten der progrannmgesteuerten Einheit ausgefuhrt 
werden, und daB aufeinanderfolgende Befehle einer 
Befehlsfolge, die in unterschiedlichen Komponenten 



auszufuhren sind, gleichzeitig ausgefuhrt werden und/ 
Oder da3 die programmgesteuerle Einheit die aus dem 
Programm- und/oder Datenspeicher gelesenen Befehle 
neben dersequentiellen Abarbeitung derselben in meh- 
rere Befehle urhfassende Makrobelehle umsetzt und in- 
tern speichert. 
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und sequentiell abarbeitet. hptenielsweise nach dem bekannten Von-Neumann-Prinzip 

roO021 Programmgesteuerte Einheiten d.eser Art sind ^e'sp'elsweise nacn 

Ur dem Harvard-Prinzip arbeitende M'^roprozessorea M.kroc^^^^^^^ sogenannten RlSC-Prozes- 

soren Diese weisen einen reduzierten Befehlssatz aui una u y ..nriausaetuhrt werden, durch f est verdrahtele 

10004] Um die Arbeitsgeschwindigkeit von P^^S^^^^'^S^^^^";,^^" mehrfach vorgese- 

K.^Lrpr;^^;rc?.tr:rrdL^^ 

Aufwand deutlich steigern laBt. kennzeichnenden Teil des Patentanspruchs 1 bean- 

[CX)07] Demnach ist vorgesehen. 

anspruchs 1 ) bzw. 

chert (kennzeichnender Teil des Patentansprucfis 2). 

100081 Damn k6nnen in einer programn.gesteue.en Einbeit. ^^^^^^^^^^l^, SlTz^sat:"- 
ehlen ausge.egt Ist. also in einer relativ ^J'-^^-'^ebauten Pjo^^^^^^^^^ ^^^^.^^^^ 3^,^,,^ 

aufwand (insbesondere ohne ausgefuhrt werden. 

jsr-srirbST^^^^^^ 

f,gToTDL"ltSngwirdnacblolgendanhandeinesAusfOhrungsb^ 

beschrieben. Es zeigen 

P,g.M einescbemat,scbeDarste.lungdesAu,bausderar«bmetisob-.ogisc.enEinbeitdervor.iegendbetracbteten 
45 programmgesteuerten Einheit, 

Pigur 2 das Format, In welchem durcb die vorllegend betracbtete programmgesteuerte EInheK generierte Makro- 

belehle gespeichert werden, 

eine schematiscbe Darste.lung das Aufbaus der vorllegend betrachteten programmgesteuerten Einbe«. 
eine schematlsohe Darste.lung des Autbaus einer berk6mmlichen programmgesteuerten Ehhelt. und 
Sine schematiscbe Darstellung des Autbaus der arlthmetisch-logischen Einheit einer herk6mmlicben pro- 
55 grammgesteuerten Einheit. 

1001 11 Bel der nachlolgend n.her beschriebenen programmgesteuerten Einheit handen es sich um einen sogenann- 
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[0012] Eine programmgesteuerte Einheit kann als RISC-Prozessor betrachtet werden. wenn sie mindestens 5 der 
nachfolgenden 8 Kriterien erfullt, namlich 

1) Anzahl der Maschlnenbefehle < 150 

5 

2) Anzahl der Adressierungsmodi < 4 

3) Anzahl der Befehlslormate < 4 

10 A) Anzahl der allgemeinen CPU-Register > 32 

5) Austuhrung aller oder der meisten Maschinenbefehle in einem Zyklus. 

6) Speicherzugriff nur uber Load/Store-Betehle 

15 

7) Festverdrahtete Steuerung, und 

8) Unterstutzung hoherer Programmiersprachen. 

20 [0013] Es sei jedoch bereils an dieser Slelle darauf hingewiesen, daO sich die Erfindung auch bei anderen Mikro- 
prozessoren, Mikrocontrollern etc. anwenden laBt, wobei die positiven Effekte der Erfindung besonders ausgepragt 
sind, wenn die nachfolgend beschriebenen Modifikationen an einer programmgesteuerten Einheit vorgenommen wer- 
den, die die von ihr auszufuhrenden Befehle sequentiell (aus einem Programm- und/oder Datenspeicher) holt und 
abarbeitet. 

25 [0014] Von den aufgelisteten RISC-Prozessor-Kriterien isl insbesondere der Punkt 5 nicht ganz problemlos reall- 
sierbar. Hierzu mu3 zumindest bei Prozessoren, deren maximaler Takt in etwa dem technisch moglichen entspricht, 
ein sogenanntes Phasenpipelining eingefuhrt werden. 

[0015] Beim Phasenpipelining werden das Holen und die Abarbeitung der auszufuhrenden Befehle in nnehrere Pha- 
sen unterteilt. Ein abzuarbeitender Befehl muB aufeinanderfolgend alle Phasen durchlaufen. wobei jedoch die die 
30 betreffenden Phasen realisierenden Teileinheiten des Prozessors parallel an verschiedenen Befehlen arbeiten (sobald 
ein Befehl n eine Phase x durchlaufen hat und in die nachste Phase x+1 eintritt, kann schon der nachste Befehl n+1 
in die Phase x eintreten). 

[0016] Die Anzahl und die Definition der einzelnen Phasen kann variieren. Im betrachteten Belspiel sind das Holen 
und die Abarbeitung der auszufOhrenden Befehle in vier Phasen, namlich 

35 

1) eine Befehlshol-Phase (Instruction-Fetch- bzw. IF-Phase), 

2) eine Decodier- und Operandenhol-Phase (Decode/Operand-Load- bzw. DL-Phase), 

40 3) eine Befehlsaustuhrungs- und Speicherzugriffs-Phase (Execute/Memory-Access- bzw. EX/ME M-Phase), und 

4) eine Zuruckschreib-Phase (Write-Back- bzw. WB-Phase) 
unterteilt. 

45 [0017] Es sei bereits an dieser Stelle darauf hingewiesen, da3 auch beliebig viel mehr und/oder anders definierte 
Phasen vorgesehen werden konnen. Hierzu und bezugllch weiterfuhrender Informationen zur RISC-Arch itektur wird 
aut Hennessy, J.L.. Patterson, D.A.: "Computer Architecture: AQuanlitative Approach", Second Edition, San Franzisco, 
Morgan Kaufmann Publishers, 1996, verwiesen. 

[0018] Die erste der genannten Phasen, d.h. die IF-Phase dient dem sequentiellen Laden der auszufuhrenden Be- 
so fehle aus einem Programm- und/oder Datenspeicher. Um das Zie! der RISC-Architektur. einen Befehl pro Takt auszu- 
fuhren, errelchen zu konnen, muB pro Takt ein Befehl (einschlieBlich aller Operanden) in den Prozessor geladen wer- 
den. Die MaBnahmen, die erforderlich sind, um dies zu bewerkstelligen (Vorsehen eines ausreichend breiten Daten- 
busses. geeignete Codierung der Befehle, Verbreiterung des Datenbusses fur Codespeicher, Vorsehen interner Re- 
gister fur erganzende Datenbits etc.) sind bekannt und bedurfen keiner naheren Eriauterung. 
55 [0019] In der zweiten der genannten Phasen, d.h. in der DL-Phase wird die im vorhergehenden Takt (in der IF-Phase) 
in den Prozessor geholte Instruktlon zunachst decodiert, um alie Informationen zur weiteren Austuhrung zu erhalten. 
AnschlieBend werden interne (Eingangs-)Register, auf die bei der Befehlsausfuhrung zugegriffen wird, mit den zur 
bestimmungsgemaBen Befehlsausfuhrung erforderlichen Daten beschrieben. 
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letzten Phase ist die Belehlsabarbeitung abgeschlossea nurchfuhrung der einzelnen Phasen des Helens 

[00221 Ein wie beschrieben arbeitender Prozessor verfugt fur ^'^ D"rcmunmng prozessors ist sche- 

l~ Abarbeitens von Befeh.en Ober -parate Tei.einhe.tea Der p nz^^^ s^che ^^^^ Ourchtuhrung 

matisch in Figur 4 dargestelit. Die 9f "-""^^^^ ^^^^ der EX/MEM-Phase). und 

r ^z^r^hS-h^ S^^^^^ -h.t a,s wesent.,chen Bestandtei, die 

arithmetisch/iogische Einheit (ALU) der P^°9^^"^^7^^l'^"?^^^^^^^^ Prozessoren der vorliegend be- 

[0023] Der vorliegend betrachtete Prozessor ,st - abwe.^hend l2^^^Z ^ufb30B - so aufgebaut. daB bestimmte 
Uchteten Art. aber unter Beibehaitung des ^'^ ^^^^[^'^'f^^^^^^^^^ die in verschiedenartigen 

Betehle. g.eichzeitig (parallel) -^S^'^^^^^^^.^f ^^^^ warden. Irr, betrachteten Bel- 

mehrere arithmetisch-logische Betehle gleichzeitig ausgeluhrt werden^ arithmelische und/oder logische Operationen 

isTierpSi— ^^^^ 

Lgisier kopieren oder den Inhalt ^-^-'^l^^f'^^^:^^^^ efslh in beiden Fallen um interne 

^;^=^tir^^^^^^^^^^ - - ar^ogischen Betehlen 
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Betehlsgruppe 

Arithmetischlogische 
Befehle und 
Kopierbefehle 

Load/Store-Belehle 



Kontroimu3-Befehle 



Aktion in der IF- 
Phase 

Bef ehl bus 
Speicher laden 

Bef ehl aus 
Speicher laden 



Aktion in der DL- 
Phase 

Registerinhalte fur 
ALU laden 

Registerinhalt als 
Adresse laden 



Bef ehl aus 
Speicher laden 



Programmzahler 
laden 



Aktion in der EX/ 
MEM-Phase 

ALU-Operation 
durchtuhren 

Datentransf er in/aus 
Speicher 



Sprungadresse 
berechnen 



Aktion in der WB- 
Phase 

Ergebnis in Register 
schreiben 



Datentransf er in/aus 
Register 



Neue Adresse in den 
Programmzahler 
schreiben 



ss 



[0029] Die arithmetisch-logischen Betehle. die Kopier-Beleh.e, und die Load-Store-Befehle werden nachfolgend als 
K^'v^etottete^^S^^^^^ erw.hnt wurde. k6nnen ein KontrollfluB-Beteh, und/oder ein oder .ehrere DatenfluB- 

Befehle parallel ausgefuhrt werden. . , allel zu anderen Befehlen ausgefuhrt werden. well 

[0031] KontrollfluBbefehle konnen im betrachteten Beispiel Para"ei zu a „^j3_{Qhrt werden. Die Ausfuhrung 
iie - anders als die anderen Betehle - nicht in der ALU^^sonde^n; ^.^,^^,3,^ 
der Kontrollflu3-Befehle ia3t sich problen^los <^'^ I^Vf Jl"' ^^^^^^^^^^ sehr einfach in die IF- 
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von KontrollfluB-Befehlen in der IF-Einheit ermoglicht es. da3 gleichzeittg in der ALU ein anderer Befehl ausgefuhrt 
wird. Es muB 'nur" darauf geachtet werden, daB keine Datenabhangigkeiten vorliegen, d.h. daB der ergenllich spater 
auszufuhrende Befehl nicht Daten verwendel, die der eigenllich fruher auszufuhrende Befehl erzeugt. Solche Daten- 
abhangigkeiten konnen jedoch problemlos gehandhabt oder ausgeschlossen werden. 
5 [0032] Dies wird deutlich, wenn man die Adressierungsformen betrachtet, die ublicherweise in KontrollfluB-Befehlen 
von RlSC-Prozessoren vorgesehen sind. Die typischerweise verwendeten Adressierungsformen sind die absolute 
Adressierung, die PC-relalive Adressierung, und die indirekte Adressierung. 

[0033] Bei der absoluten Adressierung beinhaltet der betreffende Befehl bereits die Adresse, die bei Ausfuhrung der 
(KontrollfluB-)Operation in den Programmzahler (PC) geladen wird. 
10 [0034] Bei der PC-relativen Adressierung, die sehr haufig bei Verzweigungsbefehlen (Branch-Befehlen) benutzt wird, 
enthalt der betreffende Befehl nur den Offset der neuen Adresse zum aktuellen PC-lnhalt. Zur Ermittlung des neuen 
PC-lnhaltes ist eine einfache Berechnung (Addition oder Subtraktion) erforderllch, doch exlstieren - abgesehen von 
dam zu modifizieren PC-lnhalt - keine Abhangigkeiten von Datenregistern des Prozessors 

[0035] Bei der indirekten Adressierung wird (zumindest bei RISC-Prozessoren) der neue PC-lnhalt aus einem Re- 
?5 gister des Prozessors oder einem Speicher bezogen. Dies ist Im betrachteten Belspiel die einzige Art von KontrollfluB- 
Befehlen, bei der Datenabhangigkeiten auttreten konnen. 

[0036] Falls bei KontrollfluB-Befehlen (belspielsweise bei KontrollfluB-Befehlen mit Indirekter Adressierung) Daten- 
abhangigkeiten auftreten oderauftreten konnen, so kann man diesen einfach dadurch begegnen, daB ein oder mehrere 
Wartezyklen eingefuhrt werden (daB mit der Ausfuhrung des betreffenden KontrollfluB-Befehls so lange gewartet wird, 

20 bis von vorher auszufuhrenden Befehlen vorzunehmende Zugriffe auf die Register oder Speicherzellen, deren Inhalt 
fur die KontrollfluBbefehlsausfuhrung benotigt wird, erfolgt sind). Allernativ kann vorgesehen werden, daB im Befehls- 
vorrat des Prozessors nur KontrollfluB-Befehle mit absoluter und/oder PC-relativer Adressierung vorhanden sind, oder 
daB die parallele Abarbeitung von KontrollfluB-Befehlen und sonstigen Befehlen auf KontrollfluB-Befehle mit absoluter 
und/oder PC-relativer Adressierung beschrankt wird. Dadurch lassen sich Datenabhangigkeiten bei der parallelen 

25 Ausfuhrung von KontrollfluB-Befehlen und sonstigen Befehlen prinzipiell vermeiden. 

[0037] Wenn der Prozessor mit einer sogenannten Branch-Prediction arbeitet, muB bei der parallelen Ausfuhrung 
von KontrollfluB-Befehlen und sonstigen Befehlen dafur gesorgt werden, daB mehrere der zuletztausgefuhrten Befehle 
reversibel sind. Branch-Prediction bedeutet, daB vorhergesagt wird, ob eine bedingte Verzweigung durchgefuhrt wird 
Oder nicht. Bei der Branch-Prediction handelt es sich um eine bekannte Technologie. so daB eine nahere Eriauterung 

30 unterbleiben kann; wegen weiterer Einzelheilen zu diesem Thema wird auf die vorstehend bereits erwahnte Literatur- 
stelle von J. L Hennessy et al. verwiesen. 

[0038] Wie vorstehend bereits erwahnt wurde, konnen nicht nur ein DatenfluB-Befehl und ein KontrollfluB-Befehl 
gleichzeitig ausgefuhrt werden; zusatzlich oderalternativ konnen im vorliegend betrachteten Prozessor auch bestimm- 
te DatenfluB-Befehle gleichzeitig (parallel) ausgefuhrt werden. 
55 [0039] Die DatenfluB-Befehle umfassen, wie vorstehend bereits eriautert wurde, die arithmetisch-logischen Befehle, 
die Kopier-Befehle, und die Load/Store- bzw. Speicherzugriffs-Befehle. 

[0040] Sorgt man dafur, daB Zugriffe des Prozessors auf externe oder interne Speicher ausschlieBlich uber Load/ 
Store-Befehle erfolgen, die arithmetisch-logischen Befehle also ausschlieBlich auf interne Registerinhalte wirken, so 
konnen im wesentlichen ohne oder jedenfalls ohne nennenswerten Mehraufwand ein Load/Store-Befehl und ein arith- 

40 metisch-logischer Befehl oder ein Load/Store-Befehl und ein Kopier-Befehl gleichzeitig ausgefuhrt werden. Ohne Mehr- 
aufwand, weil die Ausfuhrung von arithmetisch-logischen Befehlen und Kopier-Befehlen einerseits und die Ausfuhrung 
von Load/Store-Befehlen andererseits mangels Gemeinsamkeiten in der Befehlsausfuhrung ohnehin weitestgehend 
durch separate Komponenten des Prozessors (der EX/MEM-Teileinheit desselben) ausgefuhrt werden, und diese Kom- 
ponenten damit nurnoch vollstandig entkoppelt undals unabhangig voneinander betreibbare (insbesondere unabhan- 

45 gig voneinander parallel betreibbare) Prozessor-Komponenten ausgebildet werden mussen. 

[0041] Bei der gleichzeitigen Ausfuhrung von mehreren DatenfluBBefehlen (eventuell zusammen mit einem Kon- 
trollfluB-Befehl) muB wiederum auf gegebenenfalls vorhandene Datenabhangigkeiten geachtet werden. Dies ist jedoch 
bei der sehr einfachen Struklur des Prozessors und dem begrenzlen MaB an Parallelisierung mit verhallnismaBig 
geringem Aufwand bewerkstelligbar. 

50 [0042] Die paraliele Ausfuhrung von Befehlen in prinzipiell nach Figur 4 aufgebauten programmgesteuerten Einhei- 
ten kann sogar noch weiter gehen. 

[0043] Mit verhaltnismaBig geringem Mehraufwand konnen zusatzlich oder alternativ auch Kopier-Befehle und arith- 
metisch-logische Befehle parallel ausgefuhrt werden, denn auch diese sind mangels Gemeinsamkeiten in den zur 
Befehlsausfuhrung durchzufuhrenden Operationen ohnehin in verschiedenen Komponenten des Prozessors (der ALU 
55 desselben) auszufuhren. Auch hier muB also nur eine Entkopplung der die Befehle ausfuhrenden Prozessor-Kompo- 
nenten erfolgen. Durch eine entsprechende Entkopplung der Komponenten der ALU des Prozessors kann sogar er- 
reicht werden, daB mehrere arithmetisch-logische Befehle und mehrere Kopier-Befehle parallel ausgefuhrt werden 
konnen. Eine ALU, die es auf sehr einfache Weise ermoglicht, Kopier-Befehle und arithmetisch-logische Befehle gleich- 
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t0044] Da.it k6nnen dann ein ^or^^^^^-^^X^.Z ue 1^^^^^^^^^^ warden. 

sche Befehle und/oder e,n °der mehrere Kop.er-Bef^^^^^^^^^^ Auflosbarkeit von Datenabhangigkerten. 

Ere] r;:sSurbrg:r^^^^^^^^^^^ 

Lsi?hrung von mehreren Be.ehlen 9-tatten - nicht eu.^^ ^^^^ ^.^^,J^, ,,,,3, 

ausgef uhrt warden konnen, weist ^^-^^^^^^^"f '^S^^^^^^^^ nicht ertorderlich. mehrere EX/MEM-Ein- 

von mehreren IF-Einheiten ist nalurgemaO m.t T^'TJ'TlX^^^!^^^^^ erheblich viel einfacher aulgebaut 

^^'^^'^ 

IS Statt r.e.reren ,F-Einbetten kann i,. Prozessor ein 

Lor aus einer. Prograrr^m- und/oder Da.enspeicber gehotten B^^^^^^^^^^^ 

weniger tenge Ober den Zeltpunkl der ^^^^^^^'-^^til^^^^^ Sch.e«endurch.a.fen) mussen die 

von im internen Speteher gespeicherten Befehlen (''^'^P'^J^^'"^^^' „ Datenspeicher geholt v^erden, sondern kon- 
auszuf uhrenden Belehle dann nicht mehr aus dem P^^J^"^"^' en^eist es sich dabei. wenn die 
nen gleich aus dem internen Speicher -^f '--J^^^^^^.f^^^^ Abarbeitung derse.ben in 

aus dem Programm- und/oder Datenspeicher gelesenen Befehle "®^e" aer ^s q aesoeichert «/erden. Dann kann die 
g oichze«ig a'usf uhrbare Beteh.e umlassende ^^^f^'^^^Hu^^Z^^^ Beim vor.iegend be- 

gleichzeitige Austuhrung mehrerer Befehle besonders ^^^^^^^ ' ^^^^^^^ Gebrauch gerr^acht. Die 

srrdS^ar^^^^^^^^ — — '-^^ 

bezeichneten internen Speichers werden spater ,f "^^^"l^^^^^^ Ei^satz komrr^ende arithmetisch-logi- 

erfolgen kann. ^ 4 u.«. m^h ^ffi^ipntpr betreiben als es bei herkommlichen ALUs der 

s un^Tsr:^^^^^^^^^^^^ 

Lr zLeist getundene Autbau entspricht der ^-J; '^^ ^ ZleZt von Da.en zu neuen Datenwerten 

Berechnnungskapa2ltatenzusan.rnengefafJt.d.ede Prozesso^^^ (zur Operanden- 

zur Verfugung stelft. Die in der Figur 5 geze.gte ALU verfugt uber ^ Wsanscf.^" Steueranschlus- 
Eingabe), Ausgangsansch.Osse O (f Or das zu e^^^^^^^^^^^^^ ^ ,3, , ,3S 

Teitwrk drPrer^)S^^^^^ ^w^rr O™^^^^ Ob. die Eingangsans^Osse ,1 und .2 eingegebenen 
Dalen auszuf uhren ist. np.,i;:,rtiQen nicht oder allentalls unwesentlich komplizierter 

'^^Lrrrrns. s ^.i r:,s;risr.:=«.». ^» .o- - - 

55 [0056] Durch die rALU werden 
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Daten in einen zweiten Zwischenspeicher ZS2 eingeschrieben, und 

in einer zweiten Phase (der Zuruckschreib- bzw. Write-Back-Phase) im zweiten Zwischenspeicher ZS2 gespei- 
cherte Daten in das bereits erwahnte Registertile REGFILE transferiert. 

[0057] In diesem Zusammenhang sei nochmals daran erlnnert, da3 AdreBberechnungen hiervon ausgenommen 
sind; diese werden, wie vorstehend bereits erwahnt wurde. im betrachteten Beispiel nach Moglichkeit vorzugsweise 

in der IF-Einheit ausgefuhrt. 

[0058] Die Zwischenspeicher ZS1 und ZS2 sind die Zwischenspeicher, die ubiicherweise zwischen auteinanderfol- 
genden Stufen der Befehlsabarbeitungs-Pipeline vorgesehen werden; der Zwischenspeicher ZS1 dient der rALU als 
Operandenspeicher. und der Zwischenspeicher ZS2 als Ergebnisspeicher Die GroBe der Zwischenspeicher hangt 
von den indlviduellen Bedurtnissen ab. 

[0059] Das register file REGFILE ist ein Registerblock, der die (General-Purpose-)Register des Prozessors enthalt. 
[0060] Die arithnr^etischen Einheiten AU1. AU2 weisen im betrachteten Beispiel zwei EingangsanschlCisse, einen 
AusgangsanschluB. und einen SteueranschluB auf. Den arithmetischen Einheiten obliegt es, die uberderen Eingangs- 
anschlOsse eingegebene Eingangssignale arithmetlsch und/oder logisch zu verarbeiten. 

[0061] Die Operationen, die durch die arithmetischen Einheiten AUl , AU2 ausfuhrbar sind, konnen test vorgegeben 
Oder dynamisch einstellbar (konfigurierbar) sein; sie umfassen insbesondere arithmetische Operationen wie Addition, 
Subtraktion, Multiplikation, Division etc., logische Verknupfungen wie UND-Verknupfungen, ODER-Verknupfungen, 
Invertlerung, Komplemenlbildung etc., arithmetische und togische ShiflOperalionen, und Datenlransfers (Durchschal- 
tung eines der eingegebenen Signale zum AusgangsanschluB). Die einzelnen arithmetischen Einheiten sind dabei 
jedoch jeweils zur Durchfuhrung von nur wenigen Operationen ausgelegt, wodurch deren Aufbau und deren Betrieb 
relativ einfach sein konnen. Zur Vermeidung von MiBverstandnissen sei darauf hingewiesen, daO die arithmetischen 
Einheiten AUl, AU2 nicht jeweils einer Arithmetisch-Logischen Einheit (ALU) herkommlicher Prozessoren entspre- 
chen. Die arithmetischen Einheiten sind nur Bestandteile einer einer Arithmetisch-Logischen Einheit (ALU) entspre- 
chende Einrichtung; die arithmetischen Einheiten bilden erst in Kombination miteinander und zusammen mit den Ver- 
gleichseinheit(en), den Multipiexern und den Demultiplexern eine einer Arithmetisch-Logischen Einheit (ALU) entspre- 
chende Einrichtung. Die mehreren arithnnetischen Einheiten sind damit auch nicht mit den mehreren ALUs von super- 
skalaren Prozessoren gleichzusetzen. Uber die Steueranschlusse der arithmetischen Einheiten AUl , AU2 ist festleg- 
bar, Ob die belretfende arithmetische Einheit die Operation, zu deren Ausfuhrung sie vorgesehen ist, ausf uhrt oder 
nicht. Dies ermoglicht die praktische Umsetzung von Befehlen, deren Ausfuhrung vom Vorllegen einer bestimmten 
Bedingung abhangt. Die Bedingung kann beispielsweise der Zustand eInes bestimmten Flags sein: ist das Flag gesetzt. 
wird die der betreffenden arithmetischen Einheit obliegende Aufgabe (beispielsweise eine Addition) ausgefuhrt, ande- 
renfalls nicht (oder umgekehrt). Derartige, nachfolgend als "konditionierte Befehle" oder "predicated instructions" be- 
zeichnete Befehle ermoglichen es, die schwer handhabbaren bedlngten Sprungbefehle zu eliminleren. Bezuglich wei- 
terer Einzelheiten zu den predicated instructions und deren Generierung wird auf Wen-Mei W. Hwu et. al.: "Compiler 
Technology for Future Microprocessors", Invited Paper in Proceedings of the IEEE Vol. 83(12), Special Issue on Micro- 
processors, S. 1625 - 1640, Dez. 1995 verwiesen. Die Verwendung von predicated instructions sowie die zu deren 
Ausfuhrung erforderllchen ALU-Komponenten, d.h. die Steueranschlusse der arithmetischen Einheiten AU 1 , AU2, der 
Multiplexer MUXG3, die Vergleichs-Elnhelt GU, und der Demultiplexer DEMUX sind optional und konnen gegebenen- 
falls entfallen. 

[0062] Die Vergleichs-Einheit CU weist im betrachteten Beispiel zwei Eingangsanschlusse und einen Ausgangsan- 
schluB auf. Der Vergleichs-Einheit CU obliegt es, die an deren EingangsanschlQssen aniiegenden Signale oder Daten 
Vergleichsoperatbnen zu unterziehen. Die Operationen, die durch die Vergleichs-Einheit CU ausfuhrbar sind, konnen 
test vorgegeben oder dynamisch einstellbar (konfigurierbar) sein; sie umfassen beispielsweise GroBer-, GroBer/ 
Gleich-, Kleiner-, Kleiner/ Gleich-, Gleich, und Ungleich-Vergleiche sowie teste Einstellungen des Ausgabgssignals 
auf wahr (TRUE) und unwahr (FALSE). Der AusgangsanschluB der Vergleichs-Einheit CU ist uber den nachfolgend 
noch genauer beschrlebenen Demultiplexer DEMUX mil den Steueranschlussen der arithmetischen Einheiten AUl, 
AU2 verbunden. Vom Ergebnis der in der Vergleichs-Einheit CU hangt es also ab, ob die arithmetischen Einheiten 
AUl , AU2 die Operation, zu deren Ausfuhrung sie vorgesehen sind, ausfuhren oder nicht. 

[0063] Die Multiplexer des ersten Typs MUXC1 , MUXC2, und MUXC3, der Multiplexer des zweiten Typs MUXD. und 
der Demultiplexer DEMUX dienen zur dynamischen Auswahl der Daten- und/oder Signalquellen und der Daten- und/ 
Oder Signalzlele. Genauer gesagt dienen 

der Multiplexer MUXC1 zur Auswahl der Quellen der den EingangsanschlQssen der arithmetischen Einheit AU1 
zugefuhrten Daten und/oder Signale (mogiiche Daten- und/oder Signalquellen sind im betrachteten Beispiel der 
erste Zwischenspeicher ZS1 und die Ausgangsanschlusse der arithmetischen Einheiten). 
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erste Zwischenspeicher ZS1 und die Ausgangsanschlusse der anthmet.schen E-nherten), 

ZwrsSentpeicher ZS1 und die Ausgangsanschlusse der anthmetischen E.nhe.en), 

zweite Zwischenspeicher ZS2), 

15 der arithmetischen Einheiten). 

EingangsanschluR und mehrere Ausgangsanschlusse. gezeigte Steueranschlusse 

[0065] Die Multiplexer und der Demultiplexer we.sen ^^ruber h nausj^ der F^ur 1 m^^ g^ ^ 
Li, Ober welche einstellbar 1st, welche ^ingangsdaten und/oder -^^^^^^^^ 

schaltet werden. Die Anzahl der Steueranschlusse ^^«;9»;°/^^/^^^^^^^^ 10 Steueranschlusse erforder- 

durchschalten zu konnen. ♦u^^tie^hon Pinheiten der Verqieichs-Einheiten. der Multi- 

Len Be.Bnd,e.. C, ,ALU. al.o d„ ,«s*en E,nh.« * ,ALU-Be^.and,.ile 
U^S^S i> Ode, mch.,™ Kopie,-Bel.hl, 9teK=t,z«i9 In dies., .usge^J — 

lichen Projessoien. Die rALU ist gesenuber der ALU l"*"™!!^^^^ P,0!es50rK die Koo- 

;Srr.n^?Lt=-™^ =r:el^ a. ee.. e„,a*. „nd In de, 

r Tu'"!^:^Z^~'''-'''>^- * a.^o,a»,e„den Be.en. aue de. vo«en,nd 

LJ e,— :k=?S.Tn^.".AL. und FLAB a.egeelane, «. 

Makrobefehle generiert und im FLAB gespeichert. ausaef uhrt werden mussen, aus dem FLAB 

[00731 Die im FLAB gespeicherten Be^ehle konnen^wenn d^ese erneu^ a^^^^^^^ ^^^.^ ^^^^^^ 

Lusgslesen und ausgefuhrt werden. Sofern ^'^.^P^'^^^^^^^^^^^^^^ der Fall sein. 1st e.n im FLAB 
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zeitig mehrere Befehle zur Ausfuhrung gebracht werden. 

[0075] Im betrachteten Beispiel kann sich ein Makrobefehl aus einem Oder mehreren arithmetisch-logischen Befeh- 
len. einem oder mehreren Kopier-Befehlen, einem Speicherzugrlffs-Befehl. und einen KontrollfluB-Befehl zusammen- 
setzen. Die Makrobetehle konnen unabhangig voneinander beliebig viele Befehle umfassen, wobel die maximale An- 
5 zahl von Befehlen pro Makrobefehl von den im Prozessor verfugbaren Ressourcen abhangt und prinziplell beliebig 
groB sein kann. 

[0076] Wie vorstehend bereits mehrfach enwahnt wurde, konnen nur bestimmte Befehle parallel ausgefuhrl werden. 
Beispielsweise konnen von der Befehlsfolge 

10 1) move R4,#55h; 

2) addR2,R3,R1 

3) and R5,R4.R2 

"nur" die Befehle 1 und 2 parallel zueinander ausgefuhrt werden, weil nurdiese keine Datenabhangigkeiten aufweisen. 
IS Befehl 3 darf erst nach Befehl 1 und 2 ausgefuhrt werden, weil die Inhalte der von Befehl 3 benutzten Register vor der 
Benutzung durch Befehl 3 verandert werden mussen (der Inhall des Registers R4 wird durch Befehl 1 geandert) oder 
erst nach der Ausfuhrung von Befehl 2 verandert werden dOrfen (der Zugriff auf das Registers R2 durch Befehl 2 mu3 
erfolgen. bevor der inhalt des Registers R2 durch Befehl 3 verandert wird). 

[0077] Der FLAB ist Im betrachteten Beispiel als zeilenorientierter Speicher mit mehreren Abschnitten aufgebaut. Er 
20 ist konziplerl, um Befehle einzein oder zusammengefaRl in der bisherigen Codierung und/oder als eine Struklurinfor- 
mation zu speichern, wobei die Strukturinformation die Daten (die Konfigurationsbrts) enthalt, unter Venwendung wel- 
cher die rALU konfiguriert werden muR, um den oder die in dieser auszufuhrenden Befehle, also die Kopier-Befehle 
und/oder die arithmetisch-logischen Befehle auszufuhren. Der Algorithmus zur Ubersetzung von Kopier-Befehlen und 
arithmetisch-logischen Befehlen in eine Strukturinformation wird spater noch genauer beschrieben. 
2S [0078] Zur Vermeidung von Komplikationen werden vorzugsweise nur Befehle zusammengefaBt und parallel aus- 
gefuhrt, die dem selben Basisblock angehoren. Ein Basisblock ist eine Befehlsfolge mit nur einem Austrittspunkt, ge- 
nauer gesagt eine Befehlsfolge, die nur als Reaktion auf deren letzten Befehl verlassen werden kann. Bei der Festle- 
gung der Basisblocke kommt es auf den tatsachlichen Programmablauf an. Insbesondere wenn ein auszufuhrendes 
Programm bedingte Sprungbefehle enthalt. kann der das Sprungziel enthaltende Basisblock variierende Langen, ge- 
30 nauer gesagt variierende Anfangspunkte haben; wie aus einem spater noch beschriebenen ersten Beispielprogramm 
ersichtlich ist, kann der das Sprungziel eines bedlngten Sprunges enthaltende Basisblock im Falle der Sprungausf uh- 
rung spater beginnen als ohne Sprungausf Oh rung. 

[0079] Der Aufbau einer FLAB-Zeile ist in Figur 2 veranschaulicht. Wie aus der Darstellung ersichtlich ist, ist eine 
FLAB-Zeile im betrachteten Beispiel in sechs Felder unterteilt. welche 

35 

die Adresse des ersten Befehls der in der betreffenden FLAB-Zeile gespeicherten Befehlsfolge (First-Address- 
Feld FA) 

die Lange der in der betreffenden FLAB-Zeile gespeicherten Befehlsfolge oder die letzte Adresse derselben 
40 (Length-Feld L), 

ein Status-Bit das anzeigt, ob der oder die im Structure-lnformation-Feld gespeicherten Befehle im Original-Code 
Oder in ubersetzter Forni (als Strukturinformation zur Strukturierung der rALU) vorliegt (Indication-Bit IB), 

45 - strukturinformatlonen zur Strukturierung der rALU fur in dieser auszufuhrende Befehle (Structure-lnformation-Feld 
SI). 

einen parallel zu den im Structure-lnformation-Feld SI gespeicherten arithmetisch-logischen Befehlen und/oder 
Kopier-Befehlen ausfuhrbaren Speicherzugriffs-Befehl (Memory-Access-Feld MA), und 

so 

einen parallel zu den im Structure-lnformation-Feld SI gespeicherten arithmetisch-logischen Befehlen und/oder 
Kopier-Befehlen und/oder zu dem im Memory-Access-Feld MA gespeicherten Speicherzugriffs-Befehl ausfuhrba- 
ren KontrollfluB-Befehl (Control-Flow-Feld CF) 

55 speichern. 

[0080] Die im First-Address-Feld FA und im Length-Feld L gespeicherten Informationen dienen zur Ermittlung. ob 
im FLAB gespelcherte Makrobetehle anstelle der "normalen" (aus dem Programm- und/oder Datenspeicher geholten) 
Befehle venwendet werden konnen. und zum korrekten Selzen des Programmzahlers bei Nutzung von im FLAB ge- 
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eingesprungen »erd=n kann. wenn de,od.r Oi« in der r^^^ 

^rj:i"B:rnr.rcJ^:":nZrc^— und ^ ^ ^ 

f^ro^s SlIiMu-e*formalioo.F.ld SI entW im betraohMlen Belsplel 

f Ohrl werden, und 

. die Konstanten, unter Verwendung welcher die betreftenden Operationen auszufuhren sind. 
100831 .n die Stru«urintormation kann auch das -^^l^^^^^^/^^Zt^^^^ 

Lrdiig werden als Daten- und/oder Signalquellen n.cht stur d e ^^^^^^ 
gnalquellen verwendet, sondem nach Mbglichkert y^'^; ;?,!/^ '"'^^^^^ einerseits, welleventuell 

lignalqueue zuvor zu beschreiben hat, ^^^^^-^^^^^^^^^'^^^ SIgna.que.le nicbt a.s so.- 

weniger Register benotigt werden (wenn die '^.^^ '"^'^"''''•^^^"^^^ ganz weggelassen werden). 

Che verwendet wird, muB sie auch nicht von 
und andererseits. weii die benotigten Daten be. J^f/^^^Jf ^e^^ und von dort ab- 

r:;:,ttr:r^^^^^^^^^^ .nweLungU.en und erweist s.h i. 

J^srErso'cSer anders autgebauter FLAB Rann wie in Figur 3 veranschau.icht in die rRlSC-Architektur integriert 

Oer prinzipiene Autbau - -S.P— ^^^^ ^^^"3^^- 
herkommlicher RISC-Prozessoren. Die ^^"^ f 'i:^^'^^^^'"' "^^^^^ zusatzlich den vorstehend ausluhrlich be- 

anstatt einer ALU auf . AhoaH Rp^^olution-Einheit LAR (zur Unterstutzung 

^s's^'-rrsg^rsr^rr^reits;.™- 

Leistungsfahigkelt von rRlSC-Prozessoren ^"^^ ^. . . ,^ Bit-Reaisterarchitekturen mit Phasenpipelining 

L^urtrrsr^s^^^^^^^ 

. das theoretisohe CPI liegt bei 1. d.h., generel. ist jeder Befehl in einem Takt auslOhrbar. 
- es ist ein Data Fon^arding integriert (das Data Fonvarding ist zu Gew^hrieistung des CP. von 1 ertorderHoh) 

Branch-Target-Buffer gespeichert und anschlieSend als auszufuhren vorhergesagt. 
[0091] Der interne Aufbau der beiden Modelle weist folgende Gemeinsamkeiten auf: 
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Das Registerfile umfaBt 16 (General-Purpose-)Register mit je 16 Bit. Diese Register sind auch zur registerindirek- 
ten Adressierung von extemem Speicher geeignet. 

Die Speicherung von Programmkonstanten (eingangsseitig) erfolgt innerhalb der Strukturintormationen. Es sind 
s vier Speicherplatze a 16 Bit vorgesehen. 

Die arithnnetischen Verknupfungen sind wie tolgt auf arithmetische Einheiten AUO bis AU3 autgeteilt: AUO: Addie- 
rer/ Subtrahierer, AU1: Compare (Verglelcher mit Setzen eines Flags), AU2: Inkrement/Dekrement. AU3: EIner/ 
Zweierkonriplement. 

10 

Die logischen Verknupfungen sind wie folgt auf arithmetische Einheiten AU4 bis AU6 autgeteilt: AU4: logisches 
UND, AUS: logisches ODER, AU6: logisches Exklusiv-ODER. 

Fur Schiebe- und Rotationsoperationen, genauer gesagt fur arithmetische Shifts rechts, logische Shifts rechts/ 
15 links, und Rotation rechts/links isl eine arithmetische Einheit AU7 vorgesehen. 

Fur die Konfigurierung der rALU werden benotigt: 

je 1 0 Bit fur die Ansteuerung der den 8 arithmetischen E Inheiten vorgeschalteten 8 Multiplexer des ersten Typs, 
20 - je 5 Bit fur die Ansteuerung der insgesaml 16 Multiplexer des zweiten Typs (pro Register des Register File 

REGFILE mu3 ein Multiplexer des zweiten Typs vorgesehen werden, und 
6 Bits fur die Konfigurierung der arithmetischen Einheiten mit Mehrfachfunktionalitat, 

so daB das diese Konfigurationsbits enthaltende Structure-lnformation-Feld des FLAB - zusammen mit den 64 
2B Bits fur die Programmkonstantenspeicherung - insgesamt 230 Bits lang ist. 

Das Memory-Access-Feld MA des FLAB ist 16 Bits lang. 

Das Control-Flow-Feld CF des FLAB ist 24 Bits tang (vollstandige PC-Adresse). 

30 

[0092] Das Modell RR2 unterscheidet sich vom Modell RR1 in folgenden Punkten: 

In der rALU ist eine zusatzliche arithmetische Einheit AUS vorgesehen, welche fur die Vergleiche EQ (gleich), NE 
(ungleich), GT (groBer), GE (groBer/gleich), LE (kleiner/ gleich), LT (kleiner), TRUE (wahr) oder FALSE (falsch) 
55 konfigurierbar ist. Das Ausgangssignal wird als ein Predicatebit pi verwendet, welches auf alle anderen arithme- 

tischen Einheiten AUO bis AU7wirkenkann (proAU konfigurierbar). Ist pi gesetzt, wird die Operation durchgefuhrt, 
ist pi geloscht, wird der erste Operand ohne Veranderung am Ausgang durchgelassen. 

In der rALU ist ein zusatzlicher dynamlscher Pfadmultiplexer AU9 fur bedingte Kopier-Befehle integriert. AU9 wahit 
40 den oberen Operanden bei pi = 1 , den unteren bei pi = 0 aus. 

[0093] Fur RR2 werden nur eintge Konfigurationsbits mehr als fur RR1 benotigt. Es sollte jedoch nicht ubersehen 
werden, daB die Ausnutzbarkeit der zusatzlichen rALU-Bestandteile in RR2 in starkem Ma3 von verfugbarer Compi- 
lertechnologie (Oder angepaBter Assemblerprogrammierung) abhangig ist. 
45 [0094] Die Beispielprogramme werden auf den Modellen RR1 und RR2 jeweils unter verschiedenen Bedingungen 
ausgefOhrt, namlich 

wie in einem herkommlichen RISC-Prozessor, also ohne parallele Ausfuhrung von Befehlen (-> RISC) 

so - unter paralleler Ausfuhrung von Befehlen, wobei 

ein arithmetisch-logischer Befehl oder ein Kopier-Befehl 
ein Speicherzugriffs-Befehl, und 
ein KontrollfluB-Befehl 

55 

parallel ausfuhrbar sind (-> rRISC-Level 1 ) 
unter paralleler Ausfuhrung von Befehlen, wobei 
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10 



IS 



20 



2S 



30 



35 



ein arithmetisch-logischer Bef ehl 
mehrere Kopier-Betehle 

- ein Speicherzugritts-Betehl. und 

- ein KontrollfluB-Befehl 

parallel austuhrbar sind (-> rRISC-Level 2) 
- unter paralleler Austuhrung von Betehlen, wobei 

- mehrere arithmetisch-logische Betehle 
mehrere Kopier-Betehle 

- ein SpeicherzugrHts-Befehl. und 

- ein KontrolltluB-Befehl 

parallel austuhrbar sind (-> rRISC-Level 3). 

S rr^eir ^0^^^^^^^^ - 4^ 0; ise.. ...s e,ne ge.a.e .nza. von B. 

Byte aul 'V gesetzl isl. bzw. au( V gesetzl. (alls die Anzahl ungerade .st. 
[0097] Der C-Sourcecode dieses Programmes lautet. 

int value, mask = 0x0001; 

int k, parity = 0; 

for (k =0; k < 8; k++) 

{ 

if ( (value & mask) != 0) 

parity 0x0001; 
mask = (mask « 1) ; 

) 



40 



und die Anzahl der Takte. die zur Austuhrung des betreffenden Befehls benot.gt wiro). 





1 




load R1 .value ; Wert tur Paritatsberechnung 


45 


2 




move R2,#0 ; Zahlindex k 




3 




move R3,#1 ; mask 




4 




move R4,#0 ; parity 




5 


LOOP 


and R5,R1,R3 




6 




bne LOOP2 


50 






eor R4,R4,#1 




8 


LOOP2 


i asl R3.R3,#1 , Links-Shitl urn 1 




9 




1 inc R2 ; Schleitenzahler 




10 




1 cmp R2,#8 ; Endevergleich 


55 


11 




i bit LOOP 




12 




= store parity,R4; Resultatsspeicherung 



(1) 
(1) 
(1) 
(1) 
(1) 

(1/2) 

(1) 

(1) 
(1) 
(1/2) 

(1) 
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[0099] Die horizontalen Linien zeigen an, wo die vorstehend bereits erwahnten Basisblocke (Befehlstolgen mit nur 
einem Austrittspunkt) beginnen und enden. Im betrachteten Beispielprogramm sind insgesamt vier Basisblocke vor- 
handen. namlich ein die Befehle 1 bis 4 umfassender erster Basisblock. ein die Befehle 5 und 6 umfassender zweiter 
Basisblock, ein die Befehle 7 bis 11 Oder 8 bis 11 unnfassender dritter Basisblock, und ein den Belehl 12 umfassender 
s vierter Basisblock. Der dritte Basisblock hat verschiedene Anfangspunkte. Wo er wirklich beginnt, hangt vom tatsach- 
lichen Programmablaut ab: bei Nichl-Ausfuhrung des bedingten Sprunges in Befehl 6 beginnt er bei Befehl 7, bei 
Ausfuhrung des bedingten Sprunges bei Befehl 8. 

[0100] Die Ausfuhrung dieses Programms auf dem Modell RR1 unter den vorstehend genannten Bedingungen f uhrt 
zu folgenden Ergebnissen: 
10 





minimal 


maximal 


Anzahl der auszufuhrenden Befehle 


53 


61 


RISC 


benotigte Takte 


63 


63 




CPI 


1,19 


1,03 


rRISC-Level 1 


benotigte Takte 


43 


48 




CPI 


0,81 


0,79 


rRISC-Level 2 


benotigte Takte 


45 


49 




CPI 


0,85 


0.80 


rRISC-Level 3 


benotigte Takte 


38 


37 




CPI 


0,72 


0.61 



2S [0101] Die Assemblierung des ersten Beispielprogramms fur die Modellarchitektur RR2 ergibt folgenden Code: 



1 




load R1, value ; Wert fur Parltatsberechnung 




2 




move R2.#0 ; Zahlindex k 




3 




move R3,#1 ; mask 




4 




move R4,#0 ; parity 




5 


LOOP 


and R5,R1,R3 




6 




pne R5,#0,p1 ; pi -Flag setzen/rucksetzen 




7 




eorp R4,R4,#1 (pi); pi = 0; Kopie R4 in R4 




8 




asl R3,R3,#1 ; Links-Shift um 1 




9 




inc R2 ; Schleifenzahler 




10 




cmp R2,#8 ; Endevergteich 




11 




bit LOOP 


(1/2) 


12 




store parity,R4 ;Resultatsspeicherung, 


(1) 



[0102] Die Ausfuhrung dieses Programms auf dem Modell RR2 unter den vorstehend genannten Bedingungen f uhrt 
zu folgenden Ergebnissen: 



Anzahl der auszufuhrenden Befehle 


61 


RISC 


benotigte Takte 
CPI 


63 

1.03 


rRISC-Level 1 


benotigte Takte 
CPI 


57 
0,93 


rRISC-Level 2 


benotigte Takte 
CPI 


57 
0,93 


rRISC-Level 3 


benotigte Takte 
CPI 


43 
0.70 



[0103] Das nachfolgendbetrachtetezweite Beispielprogramm belnhaltet den Algorithmustureine 16* 16Bitlnteger- 
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«.lp„.3,^, ..^^ d.* .ne„ a..».nd.n «^*™s: Dl»= « "0^1. d. . BR, 



5 


1 




load R3.a ; Multiplikand 


(1) 




2 




load R5,b ; Multiplikator 


(1) 




3 




move R1 ,#0 , brgeDnisregi&ie>, £. • w 


(1) 




4 




move R2,#0 ; 


0) 


10 


5 




move R4,#0 ; Erweilerung R3 lur Shift 


(1) 




6 




move R6,#1 : Maskierungswert 


(1) 




7 
8 


Mul 


and R7,R5.R6 ; R7: Hiltsregister 
1 beq Mul 2 


0) 
(1/2) 


15 


9 

10 




\ add R1.R3,R1 ; 32-bit Addition 

1 addR2,R4,R2 


0) 
0) 


20 


11 
12 
13 
14 


Mul2 


asl R6,R6,#1 ; Maske shitten 
asl R3,R3,#1 ; 32-Bit-Shift 
rol R4,R4,#1 ; Ergebnis 
bcc Mul ; Ende nach 16 Shifts 


0) 

0) 

(1) 

(1/2) 



25 



30 



35 



40 



45 



50 



55 



,0,0s, D.Aus,*,.r«»»»P-o,«™n,au,d,.»^.Bm«erde„.o.s.=h.nd,.na.n»nB-.g...»n,0.d 

zu tolgenden Ergebnissen: 





minimal 


maximal 


Anzahl der auszutuhrenden Betehle 


102 


134 


RISC 


benotigte Takte 
CPl 


120 
1.18 


136 
1,01 


rRISC-Level 1 


benotigte Takte 
CPl 


76 
0,75 


107 
0,80 


rRISC-Level 2 


benotigte Takte 
i CPl 


78 
0,76 


108 
0.81 


rRISC-Level 3 


\ benotigte Takte 
1 CPl 


78 
0,76 


92 
0,69 



toioe, Der zur AustOhrung au, den, Mode.. RR2 geeignete Assemb.erCodelOr das zwe.e Beisple.sprc^ramm .autet 



1 

2 
3 
4 
5 
6 



7 

8 

9 

10 

11 

12 

13 



Mul 



load R3,a ; Multiplikand 

load R5,b ; Multiplikator 

move R1.#0 ; Ergebnisregister, 2*16 Bit 

move R2,#0 

move R4,#0 ; Erweiterung R3 lur Shift 
move R6,#1 ; Maskierungswert 



and R7,R5,R6 ; R7: Hiltsregister 
peq R7,#0,p1 ; 

addp R1,R3,R1 (/pi) ; 32-Bit-Addition 

addp R2,R4.R2 (/pi) ; 

asl R6,R6,#1 ; Maske shiften 

asl R3,R3,#1 ; 32-Bit-Shift 

rol R4.R4.#1 ; Ergebnis 



(1) 
(1) 
(1) 
(1) 
(1) 
(1) 



(1) 
(1) 
(1) 
(1) 
(1) 
(1) 
(1) 
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(fortgesetzl) 




14 


1 Bcc Mul ; Ende nach 16 Schleifen 


(1/2) 



[0107] Die Ausfuhrung dieses Programms auf dem Modell RR2 unter den vorstehend genannten Bedingungen fuhrt 
zu folgenden Ergebnissen: 



Anzahl der auszufuhrenden Befehle 


134 


RISC 


benotigte Takte 
CPI 


136 
1.01 


rRISC-Level 1 


benotigte Takte 
CPI 


122 

0,91 


rRISC-Level 2 


benotigte Takte 
CPI 


122 
0,91 


rRISC-Level 3 


benotigte Takte 
CPI 


107 
0,80 



[0108] Das nachtotgend beschriebene dritte Beispielprogramm ist ein Ausschnitt aus einer Sortlerroutine innerhalb 
eines Arrays. 

[0109] Der C-Sourcecode laulet wie tolgt: 



25 



30 



35 



40 



45 



int a [ANZ] ; 

int k, change - 0, temp; 
for( k = 0; k < ANZ-1; k++) 
{ 

if ( a[i] > a[i + l] ) 
{ 

temp = a [ i ] ; 
a[i] = a(i+l] ; 
a[i+l] = temp; 
change++; 

} 

} 



[0110] Die Obersetzung dieses Codes in Assennbler ergibt: 



so 



ss 
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1 




r-ti ' r^riinH9rlr^e;(%e fUT ArrSV B 1 

move Hi. (3) . orunoaore&oB lui ■ 


0) 




2 




add R7,n1,#2 , Aaresse + i cieinoin • 


(1) 




3 




move R2,#ANZ-1 ; Ende fur Zahlung 


(1) 


5 


4 




move R3,#0 ; Zahlindex k 


(1) 




5 




move R4,#0 ; change 1 


(1) 




6 




load R5,(R1 ) ; a[0] '^^ '^^^^ 


(1) 


10 


7 
8 
y 


LOOP 


load R6,(R7) ;a[i+1] laden | 

^ oc DC • X/orrtloirh afil > a[i+1l 

cmp RD,nb , vergieiuii ci[ij f^v^ j 
bie LOOP2 ; Sprung: Kein Tausch 


(1) 
(1) 
(1/2) 




10 




store (R1).R6 ; Arrayelemente tauschen 


(1) 
(1) 
0) 
(1/2) 


IS 


11 

12 
13 




sxore ^ri' jt***^ 
inc R4 ; change++ 
: bra LOOP3 ; unbedingter Sprung 




14 


LOOP2 


1 move R5 R6 ; Kopie wegen Indexerhoehung 


1 


20 


15 
16 
17 
18 


LOOP3 


1 inc R3 ; Schleifenindex 

j add R7,R7,#2 , nachstes Element 


(1) 
0) 






1 cmp R3,R2 ; Endevergleich 
j bit LOOP 


(1) 

1 (1/2) 



25 



30 



35 



40 



46 





minimal 


maximal 


Anzahl der auszuf uhrenden Belehle 


134 


182 


RISC 


benotigte Takte 
CPl 


151 
1.13 


199 
1,09 


rRISC-Levell 


benotigte Takte 
CPl 


106 

0,79 


126 

0.69 


rRlSC-Level 2 


i benotigte Takte 
1 CPl 


91 

0,68 


126 
0,69 


rRlSC-Level 3 


1 benotigte Takte 
i CPl 


76 
0,57 


111 
0.61 



so 



55 
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int a [ANZ] , b[ANZ-4] ; 

int k, tempSum, tempi, temp2, temp3, temp4 ; 

5 

tempi = a[0]; 
temp2 = a[l]; 
temp3 = a [2] ; 

10 

tempSum = templ+temp2H-temp3 ; 
for ( k = 0; k < AN2-3; k++) 

temp4 = a [ k+3] ; 
tempSum += temp4 ; 
blk] = tempSum»2; 
tempSum -= tempi; 
tempi = temp2; 
25 temp2 = temp3; 

temp3 = temp4 ; 

} 

30 

[0114] Die Ubersetzung dieses Codes in Assembler fuhrt zu folgendem Ergebnis: 



1 




move R1 , (a) ; Grundadresse fur Array a 




2 




move R2, (b) ; Grundadresse fur Array b 




3 




load R4,(R1 ) ; a[0] in tempi 




4 




add R1,R1,#2 ; &a[1] 




5 




load R5, (R1) ; a[11 in temp2 




6 




add R1.R1.#2 ; &a[2] 




7 




load R6,(R2) ; a[2] in lemp3 




8 




add R3.R4,R5 ; tempSum = a[0]+a[l]+a[2] 




9 




add R3,R3,R6 




10 




add R1,R1.#2 ; &a[3] 




11 




move R8,#0 ; Zahlindex k 




12 


LOOP 


load R7.(R1 ) ; a[k+3] laden 




13 




add R3.R3,R7 ; tempSum + a[k+3] 




14 




asr R9,R3.#2 ; »2 




15 




store (R2),R9 ; speichern in b[k] 




16 




sub R3,R3,R4 ; tempSum - a[k] 




17 




move R4,R5 ; Wechsein der Variablen 




IB 




move R5.R6 




19 




move R6,R7 




20 




inc RB ; Indexkorrektur 




21 




add R1,R1.#2 ; Adressenkorrektur 




22 




add R2,R2,#2 ; fur a und b 




23 




cmpR8.#ANZ-3 
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(fortgesetzt) 



P4 I jbULOOH _n2g D 

.. DDI ,.oH RRP (he\ diesem Beispiel existiert mangels 



10 



IS 



20 



An7«hl der auszufuhrenden Betehle IBU 


RISC : j 


benotigte Takte 
CPI 


182 
1,01 


rRISC-Levei 1: 


benotigte Takte 
CPI 


166 
0.92 


rRlSC-Level 2. 


benotigte Takte 
CPI 


139 
0J7 


rRISC-Level 3: 


benotigte Takte 
CPI 


112 
0,62 



2S 



30 



vorbesetzt wie es beispielsweise fur Strings eriolgen kann. 
^01?^ Derc-Sourcecode fur dieses Programm iautet w.efolgt. 



int *a, k = ANZ-1, C 
while ( k— > 0 ) 



WERT ; 



{ 



(a+k) = c; 



35 



40 



[0118] Eine Ubersetzung dieses Programms in 



Assembler fOr RR1 und RR2 f Ohrt zu folgendem Ergebnis: 



45 



SO 



1 

2 
3 
4 
5 




load R3.a ; Adresse des Arrays 
load R2,ANZ-1 ; Indexzahler 
load R1 ,c ; Wert der Variablen c 
asl R4,R2,#1 ; Indexanpassung (*2) 
add R4,R4,R3 ; Adresse *(a+k) 


(1) 
(1) 
(1) 
0) 
(1) 


6 

1' 


LOOP 


store (R4),R1 
1 sub R4,R4.#2 ; Adressanpassung 
dec R2 ; Indexanpassung 
bne LOOP ; 


(1) 
(1) 
(1) 
(1/2) 



r01191 Die Ausfulnrung dieses rrogrdm...^. v.=.. ... 
gungen f Ohrt bei 48 Array-Elementen zu folgenden Ergebn.ssen. 



55 



Anzahl der auszuluhrenden Befehle 


197 


RISC 


benotigte Takte 
CPI 


199 
1.01 
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(tortgesetzt) 



rRISC-Level 1 


benotigte Takte 
CPI 


106 
0,53 


rRISC-Level2 


benotigte Takte 

CPI 


106 

0,53 


rRISC-Level 3 


benotigte Takte 
CPI 


59 
0,30 



[0120] Wie BUS den vorstehenden Beisplelen ersichtlich ist, lessen sich die Belspielprogramme - abgesehen von bei 
bestimmten Sonderlallen auftretenden Ausnahmen - um so schneller ausfuhren. je mehr parallels Befehle parallel 
abgearbeitet warden konnen (je hoherder rRISC-Level ist). 

[0121] Im Durchschnitt ergibt sich fur die Ausfuhrung aller Beispielprogramme auf den Modellen RR1 und RR2 fol- 
gendes Gesamtergebnis: 





RR1 


RR2 


Anzahl der auszufuhrenden Befehle 


710 


730 


RISC 


benotigte Takte 
CPI 


747 
1.05 


755 
1,03 


rRISC-Level 1 


benotigte Takte 
CPI 


525 
0,74 


567 
0.78 


rRISC-Level 2 


benotigte Takte 
CPI 


494 
0,70 


533 
0,73 


rRISC-Level 3 


benotigte Takte 
CPI 


388 
0,55 


415 
0,57 



[0122] AbschlieBend wird nun noch der Algorithmus zur Generierung der FLAB-Zeilen-Eintrage beschrieben. Die 
Verwendung des FLABerweist sich unabhangig vonn realisierbaren oder zu realislerenden rRISC-Level als Vorteil. 
[0123] Bei der Generierung der FLAB-Zeilen-Eintrage mu3 unterschieden werden, ob "nur" der rRISC-Level 1 oder 
rRISC-Level 2 oder 3 realisiert werden sollen. 

[0124] Diese Unterscheidung ist notwendig, v^^eil bei rRISC-Level 1 "nur" auf bereits getrennt vorhandene Hardware- 
einheiten zuruckgegriffen werden mu3, wohingegen bei rRISC-Level 2 und insbesondere bei rRISC-Level 3 zumindest 
teilweise eine ALU nach Art der neu konzipierten rALU zunn Einsatz gebracht werden muB. 

[0125] Fur rRISC-Level 1 unnfaBt die Umsetzung von Befehlsfotgen in in FLAB-Zeilen speicherbare Makroinstruk- 
tionen folgende Schritte: 

Klassifizierung der Befehle. Inn betrachteten Beispiel werden vier Befehlsklassen unterschieden. namlich Kontroll- 
fluB-Betehle, Speicherzugrifls-Befehle, arlthmetlsch/ logische Befehle einschlieBlich der Kopier-Befehle, und son- 
stige Befehle, welche - im Gegensatz zu den Befehlen der' erstgenannten Befehlsklassen - nicht in den FLAB 
integrierbar sind. Fur jede der in den FLAB integrierbaren Befehlsklassen wird ein (anfangs unbelegter) Speicher- 
bereich im FLAB zur Vertugung gestellt. 

Eintragung von in den FLAB einzutragenden Informationen in einen temporaren Speicher, der nicht Bestandteil 
des FLAB ist, sondern der Zusammenstellung der in den FLAB einzutragenden Informationen dient. Beim Eintra- 
gen des ersten Befehls wird dessen Speicheradresse als die in das Start- Address-Fe Id des FLAB einzutragende 
Startadresse verwendet; bei den anderen Befehlen wird der AdreBzahler hochgezahit bzw. die momentane Adres- 
se als Endadresse verwendet, welche in das Length-Feld des FLAB eingetragen wird oder basierend auf welchem 
die dort einzutragende Lange der zu einem FLAB-Zeileneintrag zusammengefaBten Befehlsfolge berechnet wird. 

Bei Auttreten eines integrierbaren KontrollfluB-Befehls wie z.B. Branch. Jump etc. wird - falls fur das Control-Flow- 
Feld noch kein Eintrag existiert - der betreffende KontrollfluB-Befehl sowie die angenommene Sprungrichtung und 
das Sprungzle! eingetragen. Die Sprungbedingung (Flagabhangigkeit) ergibt sich bei bedingten Sprungbefehlen 
aus dem Befehlscode. sie kann aber auch explizit eingetragen werden. Die Eintragung der Sprungrichtung mit 
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S„u„,.., ..c^ ^« *' LO«<.A..,..Reso.«on 

ermittelt wurden). 

XL., I ^..H Qtrirp Push PoD wird dieser in das Memory-Access- 

Feld des FLAB eingetragen; Operanden "^9^" ^'^['^^^'^ J^f^g ^esetzt ist. and sie eriolgt ggf. mit einer Zu- 
eingetragen. Die Eintragung erfolgt n.cht. wenn dieses Als 
satzinformation iur Wartezyklen. falls solche 9;""^/°" f ^t^^^^^^^^^ RAW-Abhangigkeit kann 

DBtenabhangigkeiten sind a.le '=»AW-Abhang.gke^^^^^^^^ ausgeluhrten Belehl als Ziel 

beispielsweise vorliegen, wenn em als Q"^"^^ .9^""^ Datenabhangigkeiten bzw. zur Vermei- 
genutzt wird. Die einfachste Methode werden. die RAW- 

5ung lalscher Resultate besteht dann, daB J," .^^f ^^^^t^^^^^^ eines Bef ehls, dessen Integration in die 
Abhangigkeiten aufweisen oder ^^^^'^^^Z fJioe ^^ne X haben konnte, die Generierung der aktuellen 
aktuelle FLAB-Zeile eine Datenabhang.gkert zur Folge l^atte ode^^^ 
FLAB-Zeile beendet und mit der Generierung der nachsten FLAB ^ei.e y 

besetzt ist. Die Generierung einer FLAB-Ze.le kann auch enden, wenn e,^^ FLAB-Zeilen-Generierung 
welchem Grund auch immer - nioht -'9^'-' ri^^f " fn" L FLAB-Zeile ubertragen und mit der Ge- 

werden die bis dahin nurtemporar gespeicherten FLAB Zeilen uaien 

nerierungder nachsten FLAB-Zeile begonnen^ Hff.rri^nrRlSC-Level2und3-jedenfallsimvorliegendbetrachteten 
[01271 FOrdenrRlSC-Levelt istesvorteahaft undn. d^^^^^^^^ ^1 ^^^^ wenigstens teilweise in Struk- 

Beispiel - zwingend ertorderlich, die ,n ^'^^^''^^^l^f/'^/JJ^J^u so strukturierbar ist. dafi die darin auszuluhrenden 
turiniormationen umzusetzen, ""^^^ ^^-T^ JlT.fBefe^^^^ warden. Die Umsetzung von Belehlen 

Beiehle (die arithmetisch-logischen Beteh e und d,e Kop.e^^^^^^^^^ ^. ^ ^.^^^ R.SC-Struktur ohne Mehr- 

in solche Strukturinformationen -'^^<^ "^^^^'^'a^"^^^^^^ des Addierers) ausgegangen; be, 

r;aS=~^^ -~ "^^^'^ " " " 

entsprechend zu modifizieren. ^„^„Hon Refehle umlassen vorzugsweise nur unkonditionierte ("nor- 

10129 Die unkonditionierten (normalen) Befehle <Quellen-Register 

roitor"o:=«^^ 

gung Kondition). Die durch diese Befehle {^"^^^^^^^^^^ 

ausfoirbaren Aktionen, wobei die AusfOhrung der betreff^^^^^^^^^ ^ anderenfalls wird nichts 

abhangt 1st die Bedingung erfullt. ^'^^^f^^^^^^^f " ^"'jpSehh Das allgemeine Format dieser Befehle lautet: 
ausgefuhrt (der betreffende Befehl w.rkt dann w,e e.n ^OP Befehl). uas g ^^^^^ ^ ^^^^ 

<Mnemonic>p <Ziel.Register>. <Quellen-Reg>ster 1 >^^^^^^ 

desMnemonicd,e AbhangigkertderBetehlsai^fuh^^^^^^^ 9 9 ^.^^ ourchfuhrung der durch 

durch einen bestimmten Zusiand eines '^f^^J^^^^^^'^^^^^^^^^^ einen SteueranschluB verfOgende anth- 

rscrrheTdtrT^s^^^^ 

ehlen ven^endeten Bedingungs-Flags (des P'^^'^gf . Befehle lautet: pxx <Quellen.Register 

basierend auf einem Vergleich von ^.^^^^^.^^^^^^^re,^^^ spezifiziert und durch gt (gro- 

1 >, <Quollen-Register 2>. <p-Flag>. wobe. xx ^'^^^^^^7^^^^,^^^ g.eich) odar It (kleiner als) zu arsetzen .st 

Ber als), ge (groBer odar gleich) eq (g'^-c^)' "l^"^'^^^^^^^^ dienen zum Ersatz derse.ben durch die An- 

sru^rr i:;^^^^^^^^^^^^ ^'^^-^-^ --^^ — " 

^013^ ^Se umsetzung eines Befeh.s in eine Strukturinfom^ationen erfolgt im betrachteten Beispie, im wesentlichen 
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in drei Phasen. Dabei ist zu berucksichtigen. da3 die Strukturinformation einer FLAB-Zeile mehrere arithmetisch-logi- 
sche Befehle und/oder Kopier-Befehle umfassen kann (daB mehrere arlthmetisch-logische Befehle und/oder Kopier- 
Befehle in eine gemeinsame Strukturinformation umgesetzt werden konnen). 

[0133] In der ersten Phase wird zunachst ermittelt. welche rALU-Konnponente (Addierer, Subtrahierer, 
5 Multiplizierer ...) zur Ausfuhrung des betreftenden Befehls benotigt wird, und ob diese rALU-Komponente noch ver- 
fugbar ist. Ist die betreffende rALU-Komponente frei, so wird anschlie3end die erforderliche Konfiguration derselben 
ermittelt und die betreffende rALU-Komponente als belegt markiert. Zur Konfiguration der betreftenden rALU-Kompo- 
nente werden einfach die dazu vorgesehenen Bits innerhalb der zu erzeugenden Strukturinformation gesetzt oder 
zuruckgesetzt. Die Reservierung der ausgewahllen rALU-Komponente ist notwendig, urn zu verhlndern, da3 diese 
10 gleichzeitig fur mehrere Befehle verwendet werden kann. 

[0134] In der zweiten Phase der Generierung der Strukturinformation werden die den ausgewahlten rALU-Kompo- 
nenten vor- und/oder nachgeschalteten Multiplexer konfiguriert: urn die Daten-und/oder Signalquellen und die Daten- 
und/oder Signalziele entsprechend den Festlegungen In den umzusetzenden Befehlen einzustellen. 
[0135] Als Daten- und/oder Signalziel verwendete Register werden als belegt markiert, da fur in eIner FLAB-Zeile 
1S zusammengefaBten Befehle eine Zweitbelegung unzulassig ist und verhindert werden mu3. 

[0136] Neben diesem (fur alle Befehle gemeinsamen) Teil der zweiten Phase werden fur einzelne Betehlstypen 
spezielle MaBnahmen ergriffen, die sich aus den jeweillgen Besonderheiten ergeben. 

[01 37] Unter anderem muB bei bedingten Befehlen die das Vorliegen der Bedingung OberprOfende Vergleichs-Elnhelt 
ermittelt werden und deren Ausgangssigna! uber den zugehorigen Demultiplexer auf die die Operation ausfuhrende 
20 arithmelische Einheit geschattet werden. Ferner ist zu berucksichtigen, welcher Art die Bedingung ist. 

[0138] Bei bedingten Kopier-Befehlen ist zusatzlich dafur Sorge zu tragen, daB der Inhalt des Zielregisters bei Nicht- 
Ausfuhrung des Befehls nicht verandert wird. 

[01 39] Nach der zweiten Phase der rALU-Konfigurierung konnte diese beendet werden. Dies geschieht vorzugswei- 
se jedoch erst nach der Ausfuhrung der nachfolgend beschriebenen dritten Phase. 
25 [0140] In dieser dritten Phase der rALU-Konfigurierung wird ein data forwarding innerhalb der rALU realisiert. Das 
data tonwarding in der rALU ist jedoch nicht zu verwechseln mit dem data forwarding der RISC-Architektur, welches 
zusatzlich existiert. 

[0141] Die soeben kurz in Worten beschriebene Umsetzung von Befehlen in Strukturinformation en ist Im betrachteten 
Beispiel hardwaremaBig realisiert. Die Umsetzungs-Hardware ist im betrachteten Beispiel Bestandteil des FLAB (siehe 
30 Figur 3). kann aber auch anderswo (beispielsweise in der Instruktion-Fetch-Einheit IF) untergebracht sein. 

[0142] Eine wie beschrieben aufgebaute und betriebene programmgesteuerte Einheit laBt sich unabhangig von den 
EInzelheiten der praktischen Realisierung mit geringem Aufwand entwerfen. herstellen und betrelben. und arbeitet 
erhebllch schneller als herkommliche programmgesteuerte Einhelten der betrachteten Art. 



35 Bezugszelchenliste 



[0143] 



40 



45 



50 



ss 



IF Instruction-Fetch-Teileinheit des Prozessors 

DL Decode/Operand-Load-Telleinheit des Prozessors 

EX/MEM Execute/Memory-Access-Teileinheit des Prozessors 

WB Write-Back-Teileinheit des Prozessors 

LAR Look-Ahead-Resolution-Teileinheit des Prozessors 

FLAB Fetch Look-Ahead Buffer 

ALU Arithmetlsch-Logische Einheit 

11, 12 Eingangsanschlusse 

O. OSF Ausgangsanschlusse 

C, CSF Steueranschlusse 

AUn arilhmetische Einheiten 

CU Vergleichs-Einheit 

MUXCn Multiplexer eines ersten Typs 

MUXD Multiplexer eines zweiten Typs 

DEMUX Demultiplexer 

ZSn Zwischenspeicher 

REGFILE register file 
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FA First-Address-Feld einer FLAB-Zeile 
L Length-Feld einer FLAB-Zeile 
I B indication-Bit-Feld einer FLAB-Zeile 
SI Structure-lnlormation-Feld einer FLAB-Zeile 
5 MA Memory-Access-Feld einer FLAB-Zeile 
CF Control-Flow-Feld einer FLAB-Zeile 



10 



IS 



Patentanspruche 

1. Programm9esteue.e Einheit. .e.che in eine. Programm-und/oder Datenspeicher gespeicherte Be.eh.e holt und 
sequenliell abarbeitel, 

dadurch gekennzeichnet, ^««on«ohnrAn in unterschiedlichen Komponenten der programm- 

SedSen K^^ponent^ auszulOhren sind. gleichzeitig ausgelOhrt werden. 

2. Programmgesteuerte Einheit. weiche in einem Programm-und/oder Datenspe.her gespe^herte Be.eh.e ho« und 

sequentiell abarbeitel, 

20 dadurch gekennzeichnet, ^ d ^r.r=,mm nnd/oder Datenspeicher gelesenen Betelile neben 

chert. 

25 3 Programmgesteuerte Einheit nach Anspruch 2, 

ZTo:!Z1^"o^:L umgesotzte Betah.e jeweils soiche Beteh.e sind. die durch die programmgesteuerte 
Einheit gleichzeitig ausgefOhrt werden konnen. 

30 4 Programmgesteuerte Einheit nach Anspruch 2 Oder 3. 

Sr^in :lrn Ma^^^^^^^^^^^ umgesetzte Beteh.e jewei.s solche Betehie sind. die in unterschiedlichen Kompo- 
nenten der programmgesteuerten Einheit auszuf uhren smd. 

35 S. Programmgesteuerte Einheit nach einem der vorhergehenden AnsprOche, 

dadurch gekennzeichnet, ,.-.ur«„ri*>r, Rof^hiP 7umindestteilweise in einem strul<^turier- 

rrn^cu^ss— ^^^^^^^ 



baren 1 
die zur 



AL^f uhrung der jeweiligen Belehle erforderlichen Operationen austuhrt. 
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5. Programmgesteuerte Einheit nach Anspruch 5, 

dadurch gekennzeichnet, o^f^hto yumindest teiiweise in eine Strukturintormalion 

45 fenden Betehie konfigurierbar ist. 

7 Programmgesteuerte Einheit nach einem der vorhergehenden Anspruche, 
d^refsicTbrdTm^r^ulrierb^^^ HardwareblocK urn die arithmetisch-logische Einheit der programmgesteu- 

50 erten Einheit handelt. 

8 Programmgesteuerte Einheit nach einem der vorhergehenden Anspruche. 

SB ein Oder mehrere Kopier-Belehle gleichzeitig ausgetOhrt werden konnen. 

9. Programmgesteuerte Einheit nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 
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daB die programmgesteuerte Einheit eine arlthmetisch-logische Einheit mit voneinander unabhangig betreibbaren 
arithmetisch-logischen Teileinheiten aufweist. wobei jede der Teileinheiten in der Lage ist, einen arithmetisch- 
logischen Befehl Oder einen Koplerbefehl auszutuhren. 
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